排序方式: 共有50条查询结果,搜索用时 343 毫秒
41.
针对基础的聚类算法无法适应定制商务班车站点设置的问题,在传统的基于密度的带有噪声的空间聚类算法基础上,通过衡量类簇精细化服务指标确定分组效果,并对聚类效果不理想的组别依据其数据特征自动更新以扫描半径和最小包含点数为代表的聚类参数,进行迭代聚类,直到聚类效果达标为止。同时,结合节点重要度的思想改进基于密度的带有噪声的空间聚类算法,使其能够输出备选站点。研究结果表明,改进的算法能够较好地根据数据特征给出应有分组,给出的扫描半径和最小包含点参数能够较好地适应分组情况,备选节点能够有效地匹配周围的交通资源。 相似文献
42.
车辆出行次数是城市车辆出行的基本特征之一,一般采用抽样调查获得。利用城市车辆RFID(radio frequency identification)出行数据,提出了一种基于DBSCAN(density-based spatial clustering of application with noise)算法的车辆出行次数计算方法。首先,利用k-差值法计算出DBSCAN算法中ε-邻域半径;然后,利用车辆一周(月、季度、年)的RFID轨迹链数据进行DBSCAN密度聚类,获取车辆出行时间特征和出行次数。实验表明,该方法具有较高的准确性,实现简单。 相似文献
43.
为提高集群资源使用效率, 管理员需要对用户进行分类, 从而对不同用户提出资源使用策略。DBSCAN(Density Based Spatial Clustering of Applications with Noise)聚类算法可对用户进行分类, 但对初始参数敏感。为此, 提出改进算法, 首先将密度进行层次划分, 由此得出各层次的密度阈值, 在每种阈值下采用DBSCAN算法, 解决全局参数问题。在此基础上, 创新地使用一个直接可达距离排序队列, 将排序信息作为可变参数, 减小初始参数对结果的影响。通过高性能计算中心用户数据的实例验证了其可行性。实验结果表明, 改进后的算法提高了用户分类的准确性和全面性。 相似文献
44.
针对DBSCAN算法I/O开销和内存消耗大的缺陷,提出了基于层次合并的密度算法,基于密度的空间聚类算法可以有效地过滤噪声和孤立点数据,该算法在对于处理较大数据集上具有较大优势。 相似文献
45.
在使用K-Means进行文本聚类的研究中,针对K-Means算法缺点,提出了利用DBSACN算法确定参数K的方法,将基于密度的聚类算法应用于特征选取上,使得K值计算有了一定的确定性,从而提高了聚类质量。这种将多种算法混合运用的方法,为文本聚类算法的设计提供一个新的方向。 相似文献
46.
47.
针对毫米波雷达数据均匀性差,数据量小,噪点多等问题,提出一种基于DBSCAN (density-based spatial clustering of applications with noise)的雷达自适应聚类算法.改进算法能够根据K近邻距离和目标反射截面自适应调整聚类半径.首先给出一种聚类半径根据K近邻距离动态调整的机制:目标第K个近邻的距离与阈值相比较,以确定阈值半径取值.再提取雷达提供的目标反射截面,基于该值计算目标假象半径作为聚类半径的补充量.实现根据目标反射截面与数据稀疏程度自适应聚类的效果.将改进算法与不同参数的DBSCAN聚类算法在真实雷达点云数据进行实验对比.相较于选取合适参数的DBSCAN算法,改进算法能够更好适应毫米波雷达点云特征,对行人目标识别准确率提高4.18%,对车辆目标识别准确率提高5.63%. 相似文献
48.
针对民用建筑“四节一环保”原始数据中存在的数据质量问题, 使用多种方法实现数据清洗与数据修复。数据清洗方面, 重点关注单栋建筑能耗数据中存在的相似重复记录及异常记录。其中, 识别异常记录采用3σ准则、DBSCAN聚类算法及箱线图内限3种方法。数据修复方面, 重点关注缺失值的填补及基于模型的数据修正。其中, 缺失值的填充使用简单填充、线性回归模型和基于用户的协同过滤推荐算法, 并以平均绝对误差为评估指标进行对比。基于多元线性回归、主成分回归、偏最小二乘回归、岭回归及Lasso回归5种模型, 拟合建筑运行能耗与各解释变量间的关系, 对上海市建筑运行能耗相关数据进行数据修复。结果显示, 单栋建筑能耗数据适合采用箱线图内限来识别异常记录, 并使用中位数填补缺失数据; 上海市建筑运行能耗相关数据中, 岭回归模型的拟合情况最好。 相似文献
49.
研究城市中体育场地的空间分布对于改善城市空间布局、促进城市体系自我优化和健
康发展具有重要的理论和实践意义。运用DBSCAN空间聚类算法和ArcGIS空间分析工具对长沙
市主城区体育场地空间布局进行分析,运用地理探测器对其影响因素进行定量分析。研究结果表
明:(1)长沙市体育场地在空间上表现为集聚且具有梯度等级效应,呈现出中心集聚、四周分散的
特征;(2)长沙市体育场地被划分为分属5个不同等级的17个集群,噪声点零散分布;(3)长沙市体
育场地空间异质性是不同影响因素共同作用的结果,其中小区核密度、人口密度及经济发展水平
影响较大。最后基于研究结果,提出了长沙市体育场地优化选址建议。 相似文献
50.
针对风力机异常功率数据难以有效清洗的问题,提出改进的DBSCAN方法.首先将数据集离散分割,然后在各离散区间内自适应粗估DBSCNA算法参数并聚类,最后计算统计特征相似性修正聚类结果.以某风场2.5 MW风力机SCADA系统实测数据验证所提方法,结果表明:改进方法的召回率为97.97%,准确率为97.97%,F1值可达97.85%,可有效清洗风力机功率数据集,且变更数据集时改进方法结果更稳定. 相似文献